智能论文笔记

Generate, Evaluate, and Select: A Dialogue System with a Response Evaluator for Diversity-Aware Response Generation

Ryoma Sakaeda , Daisuke Kawahara

分类：自然语言处理

2022-06-10

我们的目标是克服当前对话系统的响应中缺乏多样性，并开发作为对话伙伴的对话系统。我们提出了一个生成器评估器模型，该模型评估了响应生成器生成的多个响应，并选择了评估器的最佳响应。通过产生多个响应，我们获得了多种响应。我们进行人体评估，将提议系统的输出与基线系统的输出进行比较。人类评估的结果表明，拟议系统的响应通常被认为比基线系统更好，并指出了拟议方法的有效性。

translated by 谷歌翻译

Grassmann Manifold Flow

Ryoma Yataka , Masashi Shiraishi

分类：机器学习 | (统计)机器学习

2022-11-05

Recently, studies on machine learning have focused on methods that use symmetry implicit in a specific manifold as an inductive bias. In particular, approaches using Grassmann manifolds have been found to exhibit effective performance in fields such as point cloud and image set analysis. However, there is a lack of research on the construction of general learning models to learn distributions on the Grassmann manifold. In this paper, we lay the theoretical foundations for learning distributions on the Grassmann manifold via continuous normalizing flows. Experimental results show that the proposed method can generate high-quality samples by capturing the data structure. Further, the proposed method significantly outperformed state-of-the-art methods in terms of log-likelihood or evidence lower bound. The results obtained are expected to usher in further research in this field of study.

translated by 谷歌翻译

Twin Papers: A Simple Framework of Causal Inference for Citations via Coupling

Ryoma Sato , Makoto Yamada , Hisashi Kashima

分类：机器学习

2022-08-21

研究过程包括许多决定，例如如何应有资格以及在何处发表论文。在本文中，我们介绍了一个一般框架，以调查此类决策的影响。研究效果的主要困难是我们需要了解反事实结果，而实际上并非现实。我们框架的主要见解是灵感来自现有的反事实分析，其中研究人员将双胞胎视为反事实单位。提出的框架将一对彼此引用为双胞胎的论文。这些论文往往是平行的作品，在类似的主题和类似社区中。我们调查了采用不同决策的双论文，观察这些研究带来的研究影响的进展，并通过这些研究的影响来估算决策的影响。我们发布了我们的代码和数据，我们认为由于数据集缺乏反事实研究，因此这是非常有益的。

translated by 谷歌翻译

Sparse Representation Learning with Modified q-VAE towards Minimal Realization of World Model

Taisuke Kobayashi , Ryoma Watanuki

分类：机器学习 | 机器人

2022-08-08

从高维观测数据中提取低维潜在空间对于在提取的潜在空间上构建具有世界模型的实时机器人控制器至关重要。但是，没有建立的方法可以自动调整潜在空间的尺寸，因为它发现了必要和充分的尺寸大小，即世界模型的最小实现。在这项研究中，我们分析并改善了基于Tsallis的变异自动编码器（Q-VAE），并揭示，在适当的配置下，它始终有助于使潜在空间稀疏。即使与最小的实现相比，预先指定的潜在空间的尺寸是多余的，这种稀疏也会崩溃不必要的尺寸，从而易于删除它们。我们通过提出的方法在实验中验证了稀疏性的好处，它可以轻松地使用需要六维状态空间的移动操纵器找到必要和足够的六个维度。此外，通过在提取的维度中学习的最低实现世界模型的计划，该提出的方法能够实时发挥最佳的动作序列，从而将达到的成就时间降低了约20％。随附的视频已上传到YouTube：https：//youtu.be/-qjitrnxars上

translated by 谷歌翻译

Deep Bayesian Active-Learning-to-Rank for Endoscopic Image Data

Takeaki Kadota , Hideaki Hayashi , Ryoma Bise , Kiyohito Tanaka , Seiichi Uchida

分类：计算机视觉

2022-08-05

自动基于图像的疾病严重程度估计通常使用离散（即量化）严重性标签。由于图像含糊不清，因此通常很难注释离散标签。一个更容易的替代方法是使用相对注释，该注释比较图像对之间的严重程度。通过使用带有相对注释的学习对框架，我们可以训练一个神经网络，该神经网络估计与严重程度相关的等级分数。但是，所有可能对的相对注释都是过敏的，因此，适当的样品对选择是强制性的。本文提出了深层贝叶斯的主动学习与级别，该级别训练贝叶斯卷积神经网络，同时自动选择合适的对进行相对注释。我们通过对溃疡性结肠炎的内窥镜图像进行实验证实了该方法的效率。此外，我们确认我们的方法即使在严重的类失衡中也很有用，因为它可以自动从次要类中选择样本。

translated by 谷歌翻译

Approximating 1-Wasserstein Distance with Trees

Makoto Yamada , Yuki Takezawa , Ryoma Sato , Han Bao , Zornitsa Kozareva , Sujith Ravi

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-06-24

瓦斯坦距离测量分布之间的差异，显示出各种类型的自然语言处理（NLP）和计算机视觉（CV）应用的功效。估计Wasserstein距离的挑战之一是，它在计算上很昂贵，并且对于许多分配比较任务而言，它的扩展不是很好。在本文中，我们的目标是通过树 - 瓦斯汀距离（TWD）近似1-wasserstein距离，其中TWD是带有基于树的嵌入的1-wasserstein距离，并且可以在线性时间内相对于节点的数量进行计算在树上。更具体地说，我们提出了一种简单而有效的L1调查方法来学习树中边缘的权重。为此，我们首先证明1-wasserstein近似问题可以使用树上的最短路径距离作为距离近似问题进行表述。然后，我们证明最短的路径距离可以用线性模型表示，并且可以作为基于LASSO的回归问题配方。由于凸公式，我们可以有效地获得全球最佳解决方案。此外，我们提出了这些方法的树形变体。通过实验，我们证明了加权TWD可以准确地近似原始的1-wasserstein距离。

translated by 谷歌翻译

Retrieving Black-box Optimal Images from External Databases

Ryoma Sato

分类：人工智能 | 计算机视觉 | 机器学习

2021-12-30

假设我们有一个黑盒功能（例如，深神经网络），将图像作为输入拍摄并输出指示偏好的值。我们如何在Internet上的外部数据库中获取最佳图像？文献中的标准检索问题（例如，项目建议）假设算法可以完全访问该组项目。换句话说，这种算法是为服务提供商设计的。在本文中，我们考虑了不同假设下的检索问题。具体而言，我们考虑如何使用有限的用户访问图像数据库，可以使用自己的黑盒功能检索图像。该配方使每个用户定义的灵活和更精细的图像搜索。我们假设用户可以通过具有紧密API限制的搜索查询访问数据库。因此，用户需要以查询的数量有效地检索最佳图像。我们提出了一个有效的检索算法Tiara为此问题。在实验中，我们确认我们的建议方法在各种设置下比几个基线更好地执行。

translated by 谷歌翻译

Order-Guided Disentangled Representation Learning for Ulcerative Colitis Classification with Limited Labels

Shota Harada , Ryoma Bise , Hideaki Hayashi , Kiyohito Tanaka , Seiichi Uchida

分类：计算机视觉

2021-11-06

溃疡性结肠炎（UC）分类，是内窥镜诊断的重要任务，涉及两个主要困难。首先，具有关于UC（正或负）注释的内窥镜图像通常是有限的。其次，由于冒号中的位置，它们在外观上显示出大的变化。特别是，第二个困难阻止了我们使用现有的半监督学习技术，这是第一个难度的常见补救措施。在本文中，我们通过新利用两个附加特征，提出了一种用于UC分类的实际半监督学习方法，结肠中的位置（例如，左冒号）和图像捕获顺序，两者通常都附加到内窥镜中的各个图像图像序列。该方法可以通过与这些功能有效地提取UC分类的基本信息。实验结果表明，所提出的方法在分类任务中优于若干现有的半监督学习方法，即使具有少量注释的图像。

translated by 谷歌翻译

Re-evaluating Word Mover's Distance

Ryoma Sato , Makoto Yamada , Hisashi Kashima

分类：机器学习 | 自然语言处理

2021-05-30

“移动”一词的距离（WMD）是测量两个文档相似性的基本技术。作为WMD的关键，它可以通过采用最佳传输配方来利用空间单词的基础几何形状。关于WMD的最初研究报告说，WMD在各种数据集中的大幅度边缘优于古典基线，例如词袋（Bow）和TF-IDF。在本文中，我们指出原始研究中的评估可能会产生误导。我们重新评估了WMD和经典基准的性能，并发现如果我们采用适当的预处理（即L1归一化），经典的基线与WMD具有竞争力。此外，我们引入了WMD和L1拟态化的弓之间的类比，发现不仅WMD的性能，而且距离值都类似于高维空间的弓形值。

translated by 谷歌翻译

Poincare: Recommending Publication Venues via Treatment Effect Estimation

Ryoma Sato , Makoto Yamada , Hisashi Kashima

分类：机器学习 | (统计)机器学习

2020-10-19

选择学术论文的出版物场所是研究过程中的关键一步。但是，在许多情况下，决策仅基于研究人员的经验，这通常会导致次优结果。尽管存在用于学术论文的场地推荐系统，但他们推荐了预计将发表该论文的场所。在这项研究中，我们的目标是从不同的角度推荐出版场所。我们估计，如果在每个场所发表论文，并推荐该论文具有最大潜在影响的场地，则将收到的引用数量。但是，这项任务面临两个挑战。首先，仅在一个地点发表论文，因此，如果该论文发表在另一个地点，我们无法观察到该论文收到的引用数量。其次，论文和出版物场所的内容在统计上是不独立的。也就是说，选择出版物场所存在选择偏见。在本文中，我们将场地推荐问题作为治疗效果估计问题提出。我们使用偏见校正方法来估计有效选择出版物场地的潜在影响，并根据每个场所的论文的潜在影响推荐场地。我们使用计算机科学会议的纸质数据强调了我们方法的有效性。

translated by 谷歌翻译